智能论文笔记

过度拟合和概括是机器学习中的一个重要概念，因为只有对通用应用程序进行概括的模型才是有趣的。然而，一些学生难以通过讲座和练习来学习这个重要的概念。在本文中，我们描述了学生误解过度拟合的常见例子，并为可能的解决方案提供了建议。我们涵盖了学生对过度拟合，过度拟合解决方案的误解以及通常与过度拟合问题相混淆的实施错误。我们希望我们的论文可以有助于提高学生对这个重要主题的理解和讲座。

translated by 谷歌翻译

当涉及涉及高维和空间组织的输入（例如图像）的问题时，视觉变压器（VTS）已成为卷积神经网络（CNN）的宝贵替代方法。但是，他们的传递学习（TL）属性尚未进行很好的研究，尚不完全清楚这些神经体系结构是否可以跨不同领域和CNN转移。在本文中，我们研究了在流行的Imagenet数据集上预先训练的VT是否学习可转移到非天然图像域的表示形式。为此，我们考虑了三个经过深入研究的艺术分类问题，并将其用作研究四个流行VT的TL潜力的代孕问题。它们的性能与几个TL实验的四个常见CNN进行了广泛的比较。我们的结果表明，VTS具有强大的概括属性，并且这些网络比CNN更强大。

translated by 谷歌翻译

Safe and Psychologically Pleasant Traffic Signal Control with Reinforcement Learning using Action Masking

Arthur Müller , Matthia Sabatelli

分类：机器学习

2022-06-21

交通信号控制（TSC）的增强学习（RL）在模拟中显示出比常规方法更好的控制交通流量的性能。但是，由于几个挑战，该领域尚未部署基于RL的TSC。实际部署的一个主要挑战是确保在操作过程中始终满足所有安全要求。我们提出了一种方法，可以通过使用设计安全的动作空间来确保现实世界中的安全性。动作空间包括交通阶段，代表交叉路口的非冲突信号颜色的组合。此外，动作掩盖机制可确保仅进行适当的相变。现实世界部署的另一个挑战是确保控制行为避免道路使用者压力。我们通过扩展动作掩盖机制来结合域知识来演示如何实现这一目标。我们在现实的模拟方案中测试和验证我们的方法。通过确保安全性和心理愉悦的控制行为，我们的方法推动了RL为TSC的现实部署的发展。

translated by 谷歌翻译

转移学习（TL）是一个有效的机器学习范式，允许克服一些障碍，这些障碍是对深神经网络的成功培训，从长期训练时间到大型数据集的需求。在利用TL的同时，在监督学习（SL）中建立了成熟和成功的培训实践，其在深度加强学习（DRL）中的适用性是罕见的。在本文中，我们研究了在流行的DRL基准测试中的三种不同变体的可转移性水平以及一套小说，精心设计的控制任务。我们的结果表明，在DRL环境中转移神经网络可能特别具有挑战性，并且是在大多数情况下导致负转移的过程。在理解为什么深Q网络转移得如此糟糕时，我们对培训动力学的识别动态进行了新颖的洞察力。

translated by 谷歌翻译